Product details
- Publisher : Manning Publications; 1st edition (May 10, 2015)
- Language : English
- Paperback : 328 pages
- ISBN-10 : 1617290343
-
ISBN-13 : 978-1617290343
جلد سخت سیاه و سفید_کتاب Big Data: Principles and best practices of scalable realtime data systems
Summary
Big Data teaches you to build big data systems using an architecture that takes advantage of clustered hardware along with new tools designed specifically to capture and analyze web-scale data. It describes a scalable, easy-to-understand approach to big data systems that can be built and run by a small team. Following a realistic example, this book guides readers through the theory of big data systems, how to implement them in practice, and how to deploy and operate them once they're built.
Purchase of the print book includes a free eBook in PDF, Kindle, and ePub formats from Manning Publications.
About the Book
Web-scale applications like social networks, real-time analytics, or e-commerce sites deal with a lot of data, whose volume and velocity exceed the limits of traditional database systems. These applications require architectures built around clusters of machines to store and process data of any size, or speed. Fortunately, scale and simplicity are not mutually exclusive.
Big Data teaches you to build big data systems using an architecture designed specifically to capture and analyze web-scale data. This book presents the Lambda Architecture, a scalable, easy-to-understand approach that can be built and run by a small team. You'll explore the theory of big data systems and how to implement them in practice. In addition to discovering a general framework for processing big data, you'll learn specific technologies like Hadoop, Storm, and NoSQL databases.
This book requires no previous exposure to large-scale data analysis or NoSQL tools. Familiarity with traditional databases is helpful.
What's Inside
- Introduction to big data systems
- Real-time processing of web-scale data
- Tools like Hadoop, Cassandra, and Storm
- Extensions to traditional database skills
About the Authors
Nathan Marz is the creator of Apache Storm and the originator of the Lambda Architecture for big data systems. James Warren is an analytics architect with a background in machine learning and scientific computing.
Table of Contents
PART 1 BATCH LAYER
PART 2 SERVING LAYER
PART 3 SPEED LAYER
- A new paradigm for Big Data
- Data model for Big Data
- Data model for Big Data: Illustration
- Data storage on the batch layer
- Data storage on the batch layer: Illustration
- Batch layer
- Batch layer: Illustration
- An example batch layer: Architecture and algorithms
- An example batch layer: Implementation
- Serving layer
- Serving layer: Illustration
- Realtime views
- Realtime views: Illustration
- Queuing and stream processing
- Queuing and stream processing: Illustration
- Micro-batch stream processing
- Micro-batch stream processing: Illustration
- Lambda Architecture in depth
منابع کتاب جلد سخت سیاه و سفید_کتاب Big Data: Principles and best practices of scalable realtime data systems
Big Data به شما می آموزد که سیستم های کلان داده را با استفاده از معماری بسازید که از سخت افزار خوشه ای همراه با ابزارهای جدیدی که به طور خاص برای جمع آوری و تجزیه و تحلیل داده ها در مقیاس وب طراحی شده اند، بهره می برد. این یک رویکرد مقیاس پذیر و قابل درک برای سیستم های کلان داده را توصیف می کند که می تواند توسط یک تیم کوچک ساخته و اجرا شود. به دنبال یک مثال واقع گرایانه، این کتاب خوانندگان را از طریق نظریه سیستم های کلان داده، نحوه پیاده سازی آنها در عمل، و نحوه استقرار و بهره برداری از آنها پس از ساخته شدن راهنمایی می کند.
خرید کتاب چاپی شامل یک کتاب الکترونیکی رایگان در قالبهای PDF، Kindle و ePub از انتشارات منینگ است.
درباره کتاب
برنامه های کاربردی در مقیاس وب مانند شبکه های اجتماعی، تجزیه و تحلیل بلادرنگ یا سایت های تجارت الکترونیک با داده های زیادی سروکار دارند که حجم و سرعت آنها از محدودیت های سیستم های پایگاه داده سنتی فراتر می رود. این برنامهها به معماریهایی نیاز دارند که پیرامون مجموعهای از ماشینها ساخته شدهاند تا دادهها را با هر اندازه یا سرعتی ذخیره و پردازش کنند. خوشبختانه، مقیاس و سادگی متقابل نیستند.
اطلاعات بزرگبه شما می آموزد که سیستم های کلان داده را با استفاده از معماری طراحی شده به طور خاص برای گرفتن و تجزیه و تحلیل داده های مقیاس وب بسازید. این کتاب معماری لامبدا را ارائه میکند، رویکردی مقیاسپذیر و قابل درک که میتواند توسط یک تیم کوچک ساخته و اجرا شود. شما تئوری سیستم های کلان داده و نحوه پیاده سازی آنها را در عمل بررسی خواهید کرد. علاوه بر کشف یک چارچوب کلی برای پردازش داده های بزرگ، فناوری های خاصی مانند پایگاه داده Hadoop، Storm و NoSQL را یاد خواهید گرفت.
این کتاب نیازی به مواجهه قبلی با تجزیه و تحلیل داده های مقیاس بزرگ یا ابزارهای NoSQL ندارد. آشنایی با پایگاه های داده سنتی مفید است.
چه چیزی در داخل است
- مقدمه ای بر سیستم های کلان داده
- پردازش بیدرنگ دادههای مقیاس وب
- ابزارهایی مانند Hadoop، Cassandra و Storm
- برنامه های افزودنی به مهارت های پایگاه داده سنتی
درباره نویسندگان
ناتان مارز خالق طوفان آپاچی و مبتکر معماری لامبدا برای سیستم های داده بزرگ است. جیمز وارن یک معمار تجزیه و تحلیل با سابقه در یادگیری ماشین و محاسبات علمی است.
فهرست مطالب
قسمت 1 BATCH LAYER
قسمت 2 لایه سرو
قسمت 3 لایه سرعت
- پارادایم جدیدی برای داده های بزرگ
- مدل داده برای داده های بزرگ
- مدل داده برای داده های بزرگ: تصویر
- ذخیره سازی داده ها در لایه دسته ای
- ذخیره سازی داده ها در لایه دسته ای: تصویر
- لایه دسته ای
- لایه دسته ای: تصویر
- نمونه ای از لایه دسته ای: معماری و الگوریتم ها
- نمونه ای از لایه دسته ای: پیاده سازی
- لایه سرو
- لایه سرو: تصویر
- نماهای بیدرنگ
- نماهای بیدرنگ: تصویر
- پردازش صف و جریان
- صف بندی و پردازش جریانی: تصویر
- پردازش جریان میکرو دسته ای
- پردازش جریان میکرو دسته ای: تصویر
- معماری لامبدا در عمق
ارسال نظر درباره جلد سخت سیاه و سفید_کتاب Big Data: Principles and best practices of scalable realtime data systems